생성 모델링 개론: 분류를 넘어서기
우리는 분류 모델링이라는 조건부 확률 $P(y|x)$을 학습하여 분류 및 회귀 문제를 해결하는 방식에서, 더 정교한 생성 모델링으로 전환하고 있습니다. 이제 우리의 핵심 목표는 밀도 추정입니다. 즉, 데이터의 전체 기초 분포 $P(x)$를 직접 학습하는 것입니다. 이 근본적인 변화는 고차원 데이터셋 내에 존재하는 복잡한 상관관계와 구조를 포착할 수 있게 하며, 단순한 경계 분리에서 벗어나 진정한 데이터 이해와 생성으로 나아갈 수 있게 해줍니다.
1. 생성 모델의 목적: $P(x)$ 모델링
생성 모델의 목적은 훈련 데이터 $X$가 유래된 확률 분포 $P(x)$를 추정하는 것입니다. 성공적인 생성 모델은 세 가지 중요한 작업을 수행할 수 있습니다: (1) 밀도 추정(입력값 $x$에 확률 점수를 부여하기), (2) 샘플링(완전히 새로운 데이터 포인트 $x_{new} \sim P(x)$ 생성하기), 그리고 (3) 비지도 특징 학습(잠재 공간 내에서 의미 있는, 분리된 표현 발견하기).
2. 분류: 명시적 대 임시적 가능도
생성 모델은 기본적으로 가능도 함수에 대한 접근 방식에 따라 분류됩니다. 명시적 밀도 모델예를 들어 변분 오토인코더(VAEs)과 흐름 모델은 수학적 가능도 함수를 정의하고 이를 최대화하려 시도합니다(또는 그 하한선을 최대화). 임시적 밀도 모델중에서도 특히 생성 적대 네트워크(GANs)은 가능도 계산 자체를 완전히 생략하고, 적대적 훈련 프레임워크를 사용해 $P(x)$ 분포에서 샘플링할 수 있는 매핑 함수를 학습합니다.
질문 1
생성 모델링에서 관심 있는 주요 분포는 무엇입니까?
질문 2
어떤 종류의 생성 모델은 적대적 훈련에 의존하며, 명시적인 가능도 함수를 정의하지 않습니까?
도전 과제: 이상 탐지
밀도 추정 활용
금융기관은 수백만 건의 정상 거래 기록을 기반으로 명시적 밀도 생성 모델 $G$를 훈련했습니다. 새로운 거래 $x_{new}$가 도착하였습니다.
목표: $x_{new}$가 이상(사기)인지 여부를 판단하기.
목표: $x_{new}$가 이상(사기)인지 여부를 판단하기.
단계 1
$P(x)$의 밀도 추정을 바탕으로, $x_{new}$를 이상으로 표시하기 위해 평가해야 할 통계적 측정치는 무엇입니까?
해결책:
모델은 $P(x_{new})$의 확률(또는 가능도)을 평가해야 합니다. 만약 $P(x_{new})$가 사전에 정의된 임계값 $\tau$ 아래로 떨어진다면, 즉 정상 거래의 학습된 분포 아래에서 새 점이 통계적으로 불가능하다면, 그것은 이상으로 표시됩니다.
모델은 $P(x_{new})$의 확률(또는 가능도)을 평가해야 합니다. 만약 $P(x_{new})$가 사전에 정의된 임계값 $\tau$ 아래로 떨어진다면, 즉 정상 거래의 학습된 분포 아래에서 새 점이 통계적으로 불가능하다면, 그것은 이상으로 표시됩니다.